随机森林

在以决策树为基学习器构建Bagging集成的基础上,进一步在决策树的训练过程中引入了随机属性选择

在RF中,对集决策树的每个节点,先从该节点的属性集合中随机选择一个包含k个属性的自己,然后再从这个子集中选取一个最优属性用于划分。

这使得RF的多样性不仅仅来自于样本扰动,还来自属性扰动,这大大增加了基学习器之间的差异度,有力提升了集成模型的性能。